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摘 要 : [目的 /意义 ] 在 全 球 e -science 发 展 背 景 下 ,科学 数据 管理 实践 日 益 呈 现 出 对 跨 学 科 思 维和 方法 的 渴求 ,运用 档 
案 学 领域 的 相关 理论 和 方法 有 利于 提升 科学 数据 保存 和 共享 重用 的 质量 和 效率 。 | 方法“ 过程] 采用 文本 分 析 法 
和 综合 集成 法 ,对 0CLC、 DCC、RDA ICA 四 个 国际 组 织 相 关 文 献 成 果 中 涉及 的 档案 学 理论 和 方法 及 相关 科学 数据 
-一 管理 工作 进行 了 文本 编码 和 归纳 分 析 。[ 结果 /结论 ] 档案 学 视角 下 的 数字 文档 连续 性 保障 、 背 景 信息 管理 .鉴定 
> 处 置 和 长 期 保存 对 科学 数据 管理 具有 支撑 作用 ,建议 通过 开展 跨 学 科 合 作对 话 、 建 立 跨 机 构 连 续 性 管理 制度 框 
GO 。 架 . 培 育 具有 档案 专长 的 数据 馆 员 等 路 径 提升 科学 数据 管理 效能 。 
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国际 组 织 


跨 学 科 ”数据 馆 员 


十 
CD 随 着 e-science 的 不 断 发 展 ,科学 数据 共享 和 重用 
成 潭 全 球 科学 办 共同 的 目标 。 记 录 科学 活动 过 程 的 科 
学 瑞 据 具有 数据 和 档案 的 双重 属性 ,从 理论 上 来 说 , 档 
案 学 可 以 为 科学 数据 管理 提供 理论 与 方法 支撑 。 在 科 
学 到 据 和 相关 信息 资源 融合 共享 的 趋势 下 ,科学 数据 
管 旺 领 域 和 档案 领域 的 权威 性 国际 组 织 , 如 联机 计算 
机 烟 书 馆 中 心 (Online Computer Library Center, OCLC) 、 
美国 数字 管 护 中 心 ( Digital Curation Center,DCC) .研究 
数据 联盟 (Research Data Alliance, RDA) 和 国际 档案 理 
事 会 (International Council on Archives ,ICA ) 等 , 十 分 重 
视 档案 管理 领域 的 理论 与 方法 在 科学 数据 管理 中 的 应 
用 ,通过 成 立 专业 兴趣 组 .开展 调查 研究 .发布 指南 工 
具 等 途径 ,对 档案 学 理论 与 方法 在 科学 数据 鉴定 ,全 程 


学 原则 和 技能 如 来 源 原则 、 鉴 定 和 评估 、 真 实 性 、 元 数 
据 、 风 险 管理 和 信任 等 在 科学 数据 管理 中 起 着 至 关 重 
要 的 作用 ,明确 在 元 数据 中 捕获 体现 科学 数据 质量 
(准确 性 可 靠 性 真实 性 等 ) 的 内 容 ” ,促进 档案 管理 
员 参 与 科学 数据 生命 周期 早期 阶段 的 管理 ” ,开展 科 
学 数据 的 价值 鉴定 等 ” ,倡导 档案 专业 人 员 在 科学 数 
据 管理 中 积极 发 挥 作用 。 

然而 ,上 述 研 究 成 果 相 对 零星 ,缺乏 综合 集成 , 且 
多 为 西方 国家 制度 和 管理 环境 下 的 产物 。 我 国 档案 工 
作者 在 科学 数据 管理 工作 中 的 参与 度 普遍 较 低 ,档案 
学 理论 与 方法 在 科学 数据 管理 领域 应 用 较 少 。 为 进 一 
步 增强 科学 数据 管理 领域 中 跨 学 科 方法 的 融合 ,笔者 
认为 有 必要 针对 当前 科学 数据 管理 面临 的 挑战 ,综合 


管理 .背景 信息 管理 .长 期 保存 等 方面 的 关键 作用 开展 
了 系列 研究 , 残 励 引 入 档案 学 理论 与 方法 完善 科学 数 
据 的 管理 实践 ,形成 了 可 供 借鉴 的 成 果 。 与 此 同时 , 国 
内 外 学 者 也 从 不 同 视角 提出 了 档案 学 理论 和 方法 在 科 
学 数据 管理 中 发 挥 价值 的 探索 性 论点 ,包括 档案 工作 
者 与 科学 家 合作 以 了 解数 据 管理 和 保存 需求 ,档案 


科学 数据 管理 领域 和 档案 学 领域 的 相关 研究 成 果 , 分 
析 档 案 学 对 科学 数据 管理 的 支撑 作用 ,以 期 推动 图 情 
档 跨 二 级 学 科 的 研究 ,为 相关 实践 提供 启发 。 


1 研究 方法 与 数据 来 源 
本 研究 主要 采用 文本 分 析 法 和 综合 集成 法 。 首 
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先 ,通过 网 站 调研 ,选择 0CLC .DCC .RDA ,ICA 等 权威 
性 国际 组 织 发 布 的 相关 研究 成 果 为 重点 分 析 文 本 , 畏 
以 国内 外 学 者 的 代表 性 文献 ( 见 表 1) ,对 其 中 涉及 到 
的 档案 学 理论 和 方法 及 其 所 支撑 的 科学 数据 管理 工作 
进行 编码 ( 见 表 2) 。 在 此 基础 上 ,按照 档案 学 理论 和 
方法 所 解决 的 问题 进行 综合 集成 ,归纳 可 以 支撑 科学 
数据 管理 的 档案 学 视角 。 

在 重点 调研 的 四 个 国际 组 织 中 , 0CLC 成 立 于 
1967 年 ,是 联合 全 球 图 书馆 社区 建设 的 联机 计算 机 图 
书馆 中 心 ,创建 了 世界 上 最 大 的 在 线 公 共 访 问 目录 
WonldCatla 。 作 为 全 球 最 大 的 文献 信息 服务 机 构 之 
一 ,其 设计 开发 的 联机 计算 机 系统 等 产品 和 服务 广泛 
应 用 于 世界 各 地 的 图 书馆 和 科研 机 构 。 针 对 科学 数据 
的 管理 问题 ,0OCLC 开展 了 一 系列 与 档案 学 相关 的 研究 
性 注 动 ,包括 成 立 专业 咨询 组 .设计 面向 档案 馆 和 特 藏 
高 辐 的 研究 学 习 议 程 ,发 布 《档案 优势 :将 档案 专业 知 
4 竹 合 到 数字 图 书馆 资料 的 管理 中 》 研 究 报告 ,关注 数 
对 数据 背景 的 需求 及 学 术 文 件 管理 的 发 展 变化 


等 中 

Opcc 是 国际 公认 的 数字 管 护 专业 研究 机 构 ,专注 
立 数据 管理 的 能 力 和 技能 , 旨 在 为 存储 、 管 理 、 保 

抗 和 共享 数字 研究 数据 的 机 构 提供 专家 建议 和 实用 帮 

A 表 1 调研 文本 对 象 基本 情况 


文本 名 称 文本 类 型 来 源 


助 ”, 其 设计 的 数据 管 护 生命 周期 模型 具有 广泛 的 国 
际 影响 力 。DCC 重视 档案 鉴定 等 专业 理论 在 科学 数据 
管理 中 的 重要 价值 ,开发 了 《研究 数据 鉴定 与 挑选 指 
南 兴 决定 数据 保存 的 五 个 步骤 兴 在 哪里 保存 研究 数 
据 》 等 指南 工具 ,为 科学 数据 管理 提供 实 操 性 指导 。 

RDA 是 由 欧盟 委员 会 .美国 国家 科学 基金 会 、 美 
国家 标准 与 技术 研究 院 以 及 澳大利亚 政府 创新 部 于 
2013 年 发 起 的 一 个 社区 驱动 的 国际 组 织 , 旨 在 通过 建 
立 社会 和 技术 基础 设施 ,实现 全 球 科学 数据 开放 共享 
和 重用 的 目标 ”。RDA 成 立 了 档案 与 文件 专业 兴 
组 ( Archives and Records Professionals for Research Data 
IG ,简称 ARPRD ) ” ,探索 以 档案 文件 管理 为 代表 的 
言 息 科学 与 研究 数据 管理 的 交叉 领域 ,倡导 将 档案 专 
业 在 元 数据 .背景 信息 管理 .鉴定 和 长 期 保存 等 方面 的 
技能 和 优势 引入 科学 数据 管理 。 

ICA 是 档案 领域 最 具 权威 的 国际 组 织 , 致 力 于 文 

件 档 案 的 有 效 管理 和 世界 档案 遗产 的 保护 利用 。 其 下 
设 的 大 学 与 研究 机 构 档 案 处 科学 与 研究 数据 委员 会 专 
门 从 事 高 校 科 学 数据 和 文件 管理 的 研究 。 该 委员 会 发 
布 了 《科学 文件 和 数据 管理 与 保存 指南 》, 提 出 了 基于 
研究 流程 的 科学 数据 识别 与 管理 方案 、 科 学 数据 长 期 
保存 的 鉴定 标准 和 管 护 策略 。 


加 


和 (档案 优势 :将 档案 专业 知识 融合 到 数字 图 书馆 资料 的 管理 中 》010] 研究 报告 ”OCLC 
全 (全 科学 家 对 数据 重用 的 满意 度 》111 论文 OCLC 
3 《数据 重用 用 户 视角 的 “背景 "》[D2] 论文 oOCLC 
-和 《不断 发 展 的 学 术 文件 》 [3] 研究 报告 ”OCLC 
个) 《研究 数据 鉴定 与 挑选 指南 )4] 草 南 工具 ”DCC 
L6 《决定 数据 保存 的 五 个 步骤 》L5] 痢 南 工具 ”DCC 
L7 《数据 管 护 生命 周期 模型 》[161 8 南 工具 ”DCC 
L8 《在 哪里 保存 研究 数据 》17] 痢 南 工 具 ”DCC 
19 《RDA 第 11 次 全 体会 议 之 联合 会 议 :档案 与 文件 专业 组 和 图 书馆 员 专业 组 》[l8] 会 议 记录 ”RDA 


LI0 《RDA 第 9 次 全 体会 议 :档案 与 文件 专业 组 》 1 
LI1 《科学 文件 和 数据 管理 与 保存 指南 》[201 


L12 《档案 概念 在 数据 密集 型 环境 中 的 应 用 :与 科学 家 合作 以 了 解数 据 管理 和 保存 需求 [1 


L13 《科学 数据 如 何 增值 ” 数字 管 护 与 人 为 因素 :文献 综述 》21 
L14 《今天 的 数据 是 明天 研究 的 一 部 分 :科学 中 的 档案 问题 13] 


会 议 记 录 ”RDA 


站 南 工具 ”ICA 


刊 论文 ”Archival Science 


刊 论文 ”Archival Science 


刊 论文 Archivaria 


究 
L15 《将 档案 实践 向 前 端 移动 :基于 协作 田野 调查 方法 对 生态 传 感 数据 生命 周期 的 研究 探索 》14 刊 论文 International Journal of Digital Curation 


L16 《科学 数据 价值 鉴定 研究 进展 》[51 
L17 《文件 管理 与 研究 数据 :观点 回顾 》[211 
L18 《开放 研究 数据 :问题 与 机 遇 》[221 
Z19 《开放 研究 数据 ,一 个 档案 挑战 ?》 全 
L20 《数字 监护 研究 中 档案 学 理论 的 应 用 及 启示 探析 》[241 

I21 《利益 相关 者 视角 下 档案 部 门 参与 科学 数据 管理 的 分 析 》[251 


刊 论文 《情报 科学 》 


刊 论文 ”Records Management Journal 


刊 论文 ”Records Management Journal 


刊 论文 。 Archival Science 
刊 论文 《档案 学 通讯 》 
刊 论文 《档案 天 地 》 
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此 外 ,笔者 在 国际 档案 学 领域 和 数字 管 护 领域 的 
知名 期 乔 Archival Science、The American Archivist Archi- 


varia .Archives and Records Archives and Manuscripts Re- 
cords Management Journal International Journal of Digital 
Curation 的 官网 以 “scientific data/research data + ar- 
chive/records” 为 关键 词 检 索 , 以 及 在 中 国 知 网 以 “档案 

+ 科学 数据 /研究 数据 /数据 管 护 /数字 监护 "为 关键 词 
检索 ,选取 了 检 出 文献 中 涉及 运用 档案 学 理论 和 方法 


进行 科学 数据 管理 研究 的 代表 性 论文 ,作为 本 文 综合 
集成 的 文献 源 补充 。 

本 研究 采用 开放 性 编码 的 方式 对 文本 数据 进行 了 
分 析 和 整合 。 首 先 ,笔者 分 别 对 所 有 文本 进行 阅读 分 
析 , 提 取 资 料 中 的 主要 理论 和 方法 概念 进行 编码 ;进而 
对 比 两 份 编码 结果 ,将 提取 的 概念 进一步 归 类 为 更 高 
层次 的 视角 概念 ,并 对 其 分 解 和 描述 。 最 后 ,将 提取 的 
概念 互相 贯穿 和 关联 ,形成 编码 对 照 表 ,如 表 2 所 示 : 


表 2 档案 学 理论 与 方法 、 科 学 数据 管理 工作 对 照 编 码 及 对 应 来 源 


档案 学 视角 总 结 档案 学 理论 与 方法 科学 数据 管理 工作 对 科学 数据 管理 工作 的 支撑 来 源 文本 对 象 
数字 文档 连续 性 前端 控制 全 程 管理 实时 捕获 数据 连续 性 管理 《前端 管控 全 流程 管理 数据 全 生命 周 ”LI11,L12,L15 ,LI17 ,I21 
保障 (A2) (52) 期 管理 


背景 信息 管理 


背景 管理 关联 管理 来 源 原则 元 数据 


数据 背景 管理 


保存 数据 背景 过 程 数 据 与 结果 数据 的 


L1 ,12,13,14,L13,L14,L15, 


(A3) (53) 关联 数据 可 追溯 元 数据 L20 ,L21 

性 症 处 置 (Al1) 价值 鉴定 技术 鉴定 处 置 制定 保管 期 ”数据 选择 与 处 置 ”数据 鉴定 成 本 效益 权衡 处 置 确定 保 ”L1,15 ,L6,L7,LI1,L13 ,L16 ， 
~ 限 表 (S1) 管 期 限 L17,L18 ,L20 ,L21 

(保存 (44) 保存 长 期 保存 数据 保存 (S54) 数据 管 护 长 期 保存 Ll, L8, L9, L10, Lll, L12, 
09 LI4,L17,L18 ,L19 

(2 

〇 此 外 ,笔者 还 对 中 国 科学 院 高 能 物理 研究 所 ,全国 | 期 维护 ,提出 了 前 端 控 制 和 全 程 管理 的 原则 ,倡导 


盐 砚 资料 馆 、 国 家 生物 信息 中 心 等 单位 进行 了 实地 调 
研 :中 了 解 其 科学 数据 管理 现状 和 档案 部 门 参与 的 实 
际 情 况 , 从 实证 的 角度 考察 和 夯实 本 文 综合 集成 结 


本 | 
| 
未: 


研究 发 现 

数字 文档 连续 性 保障 与 科学 数据 管理 工作 
数字 文档 连续 性 保障 

.三 数字 文档 连续 性 保障 可 以 理解 为 数字 环境 下 的 文 
档 一 体 化 管理 理念 , 即 在 从 文件 产生 到 销毁 或 作为 档 
案 永 久保 存 的 整个 文件 生命 周期 中 采用 连续 一 臻 的 方 
法 ,以 减少 不 同 生命 周期 阶段 因 管 理 不 一 致 而 产生 的 
内 部 损耗 ,达到 整体 效益 最 佳 。 孕 育 于 20 世纪 40 年 
代 的 文件 生命 周期 理论 初步 揭示 了 不 同 阶段 文件 和 档 
案 管理 活动 的 关联 。 随 着 电子 文件 的 普及 ,20 世纪 


通过 法 规 标准、 系统 、 技 术 等 多 种 方式 ,在 文件 形成 阶 
段 (甚至 提前 到 系统 设计 阶段 ) 就 介入 管理 ,并 对 文件 
创建 .捕获 保存 、 处 置 、 组 织 和 利用 的 整个 过 程 进 行 持 
续 管控 ,从 而 持续 保障 文件 真实 性 完整 性 和 可 用 性 。 
2.1.2 对 科学 数据 管理 工作 的 支撑 

在 我 国 科 学 数据 管理 实践 中 ,数据 管理 部 门 一 般 
是 在 科研 活动 取得 阶段 性 或 最 终 成 果 之 后 才 对 其 科学 
数据 进行 收集 保存 ,提供 共享 利用 ,未 从 源头 上 建立 全 
流程 .连续 性 的 数据 全 生命 周期 管理 模式 。 全 国 地 质 
资料 馆 等 部 门 虽然 对 数据 汇 交 提出 了 明确 的 质量 要 
求 , 但 在 实践 中 仍然 会 面 对 数 据 格式 多 样 化 的 问题 ,给 
数据 整合 和 长 期 保存 带 来 巨大 挑战 。 国 务 院 办 公 厅 
2018 年 出 台 的 《科学 数据 管理 办 法 》( 以 下 简称 《办 
法 》) ” 主要 规定 了 科学 数据 的 汇 交 制度 和 共享 利用 
工作 ,并 未 对 科学 数据 生成 阶段 的 数据 规范 ,收集 范围 


90 年 代 澳大利亚 著名 档案 学 者 F. Upward 和 S. Mck- 
emmish 提出 了 文件 连续 体 理论 ,强调 文件 档案 管理 活 
动 的 整体 性 和 连续 性 ,在 全 球 档案 界 引 起 广泛 共鸣 , 促 
进 了 数字 连续 性 政策 和 行动 计划 的 发 展 , 如 英国 国家 
档案 馆 2007 年 启动 的 数字 连续 性 项 目 、 新 西 兰 国家 档 
案 馆 2009 年 启动 的 数字 连续 性 行动 计划 和 澳大利亚 
国家 档案 馆 2015 年 发 布 的 《42020 数字 连续 性 政策 》， 
强调 在 信息 持续 运动 中 构建 信息 管理 的 系统 性 框 
。 在 我 国 ,档案 学 者 也 逐渐 意识 到 ,在 文件 生命 
周期 后 端 被 动 等 待业 务 输 出 不 利于 档案 质量 把 控 和 长 
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和 后 期 的 长 期 保存 做 出 明确 要 求 ,未 能 体现 数据 全 程 
管理 和 前 端 控制 的 思想 。 缺 乏 连续 性 管理 保障 的 科学 
数据 管理 工作 存在 数据 收集 不 齐全 ,数据 质量 不 规范 、 
数据 关联 不 完整 数据 利用 不 充分 等 潜在 问题 和 风险 ， 
不 利于 科学 数据 资源 的 有 效 增值 和 开发 。 

建立 数字 连续 性 管理 思维 ,实施 全 流程 连续 性 管 
理 有 助 于 从 根本 上 提高 科学 数据 质量 。 可 借鉴 DCC 
的 数据 管 护 生命 周期 模型 和 1ICA 的 全 流程 数据 识别 与 
管理 方案 所 体现 的 连续 管理 思维 ,同时 鼓励 档案 工作 
者 参与 到 科研 活动 早期 阶段 中 ,对 科学 数据 开展 连续 
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性 管理 。 2.2 背景 信息 管理 与 科学 数据 管理 工作 


DCC 设计 的 数据 管 护 生命 周期 模型 是 体现 连续 
性 管理 思维 的 典型 代表 。 根 据 该 模型 ,理想 的 数据 
管 护 活 动 应 涵盖 从 初始 的 概念 化 设计 到 数据 创建 与 
接收 .鉴定 与 挑选 .数据 采集 .保存 与 存储 、 获 取 利 
用 .转化 与 迁移 ,社区 观察 和 参与 .数据 描述 等 各 个 
阶段 在 内 的 数据 全 生命 周期 。 其 中 ,概念 化 设计 即 
设想 并 规划 数据 的 创建 活动 ,包括 设 定 捕获 方法 和 
数据 存储 范围 ;创建 和 接收 是 指 创 建 元 数据 ,并 从 数 
据 创建 者 、 其 他 单位 存储 库 或 数据 中 心 接收 数据 "1。 
这 两 项 活动 充分 体现 了 对 数据 管理 的 前 端 管 控 思 
维 ,在 数据 形成 阶段 就 脱 入 数据 的 管理 方案 和 收集 
范围 ,明确 元 数据 要 求 , 全 面 保障 整个 数据 生命 周期 
内 管理 的 连续 性 。 

CGICA 以 科学 活动 生命 周期 为 基础 ,提出 了 基于 研 
究 铭 流程 的 数据 识别 与 保存 管理 方案 ,也 体现 了 科学 
产 猎 连续 性 管理 的 思维 。 该 方案 将 一 般 研究 项 目的 整 
信 事 程 概括 为 八 个 不 同 阶段 的 循环 过 程 ( 见 图 1) ,分 
别 是 科学 问题 的 提出 .规划 ,原始 数据 收集 分析, 评 估 
能 汤 . 结 果 报 告 ,财务 报告 和 催生 新 研究 ”。 在 整个 
活动 过 程 中 ,存档 被 视 为 其 中 的 一 项 核心 活动 , 除 


| 


导 信 归档 为 核心 开展 数据 管理 活动 ,体现 了 实时 捕获 、 
同 缚 管控 集成 管理 的 理念 ,有 助 于 确保 各 类 科学 数据 
收 守 、 保 存 和 管理 的 连续 性 。 


1 研究 活动 阶段 分 布 与 数据 流向 示意 


此 外 ,e-science 研究 活动 的 成 功 不 仅 取 决 于 科学 
家 和 技术 人 员 之 间 的 有 效 合作 ,也 取决 于 档案 管理 员 
的 积极 参与 ,应 鼓励 档案 工作 者 更 好 地 理解 科学 活动 
过 程 ,并 使 其 能 够 参与 到 数据 生命 周期 的 早期 阶段 ,从 
前 端 改 善 科学 数据 的 管理 质量 。” 


2.2.1 新 来 源 观 与 背景 信息 管理 

来 源 原 则 (Principle of Provenance ) 是 世界 公认 的 
档案 整理 理论 ,也 是 档案 学 的 支柱 性 理论 之 一 。 来 源 
原则 强调 档案 整理 要 尊重 来 源 ,尊重 全 宗 的 完整 性 以 
及 尊重 全 宗 内 的 原始 有 机 联系 。 ”按照 来 源 而 非 主题 
组 织 档案 信息 成 为 档案 领域 的 独特 方法 。 在 电子 文件 
时 代 , 来 源 原则 受到 新 技术 环境 的 冲击 ,进而 导致 来 源 
原则 “重新 发 现 ” ,并 诞生 了 “新 来 源 观 ”。 新 来 源 观 视 
角 下 ,学 者 们 对 “来 源 ”的 概念 进行 了 重新 闻 释 ,突破 
“文件 形成 者 来 源 " 或 “机 构 来 源 " 的 固有 认识 ,将 文件 
的 形成 背景 (Context) , 即 文件 是 由 谁 、 在 什么 职能 活动 
中 为 了 何 种 目的 ,采用 怎样 的 结构 形式 生成 等 方面 的 
综合 背景 信息 也 视 为 来 源 信息 “” 。 背 景 信息 不 仅 是 
档案 组 织 的 依据 ,也 是 档案 鉴定 的 重要 参考 , 即 档案 鉴 
定 不 仅 要 判断 单 份 档案 的 价值 ,还 要 根据 档案 之 间 的 
背景 关联 来 判断 同一 个 业务 活动 中 产生 的 一 整套 档案 
的 价值 。 从 文件 构成 来 看 ,背景 和 内 容 、 结 构 是 文件 的 
三 要 素 。 档 案 界 一 致 认为 背景 是 文件 档案 之 所 以 成 为 
业务 活动 凭证 的 关键 ,是 维护 电子 文件 真实 性 .完整 性 
和 可 理解 性 的 重点 ,特别 强调 关注 形成 文件 的 职能 . 计 
划 活动 .业务 等 表现 "宏观 联系 ”的 背景 信息 。 因 此 ， 
背景 是 档案 学 理论 的 核心 概念 ,背景 信息 管理 是 档案 
管理 的 核心 技能 之 一 ,档案 工作 者 在 捕获 数字 文件 本 
身 的 同时 ,需要 同时 捕获 文件 创建 过 程 、 利 用 权限 、 保 
管 情况 和 预期 用 途 等 背景 信息 。 
2.2.2 ”对 科学 数据 管理 工作 的 支撑 

在 科学 数据 整理 方面 ,人 们 会 认为 按照 学 科 或 主 
题 分 类 是 常见 做 法 。 然 而 ,笔者 调研 3 个 案例 中 ,有 2 
个 遵循 了 来 源 原 则 。 其 中 地 质 资料 馆 的 做 法 是 将 一 个 
调查 活动 中 形成 的 所 有 资料 整理 成 卷 ,该 馆 同时 具备 
科学 数据 中 心 和 专业 档案 馆 的 性 质 ,其 做 法 源 自 对 于 
科技 档案 “成 套 性 ”整理 的 要 求 。 国 家 生物 信息 中 心 
按照 “项 目 (project) -样本 (Sample) - 实验 (Experi- 
ment) -测序 (Run) ”的 结构 组 织 生物 科学 数据 ,在 整 
理 逻 辑 上 与 按照 文件 业务 来 源 的 背景 进行 整理 的 档案 
学 方法 高 度 一 致 。 虽 然 该 单位 的 科学 家 和 数据 管理 者 
并 不 了 解 档案 学 理论 和 方法 ,但 其 在 实践 中 摸索 的 信 
息 组 织 方法 恰恰 体现 了 背景 关联 旺盛 的 生命 力 。 

在 数据 溯源 方面 , 随 着 大 数据 技术 的 不 断 发 展 , 通 
过 整合 不 同 领域 ,不 同 来 源 和 不 同类 型 的 科学 数据 , 进 
行 综合 分 析 来 解决 科学 问题 的 趋势 越 来 越 显 著 ,这些 
数据 的 真实 性 和 可 信和 性 直接 影响 到 分 析 结 果 的 准确 
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性 ,因此 科学 数据 信息 的 背景 可 追溯 性 变 得 日 益 重 要 。 
OCLC 通过 对 数据 重用 满意 度 和 数据 用 户 所 关注 的 数 
据 背景 的 研究 发 现 ,从 科学 数据 重用 需求 的 视角 来 看 ， 
保存 数据 产生 的 背景 信息 和 保存 数据 内 容 同样 重要 ， 
且 数 据 的 几 个 质量 属性 一 完整 性 .可 访问 性 . 易 操作 
性 和 可 信 度 ,与 数据 重用 满意 度 有 着 明显 的 正 相 关 关 
系 "*。 因 此 ,科学 数据 的 保存 不 仅 要 保存 结果 数据 
和 过 程 数 据 本 身 ,还 要 保存 数据 软件 信息 .数据 提供 
者 .研究 项 目 信息 .处理 活动 .共享 利用 等 背景 信息 , 否 
则 未 来 研究 者 可 能 找 不 到 完整 的 资料 支撑 新 的 研究 ， 
反映 相关 研究 历史 的 记录 也 可 能 残缺 "”"。0OCLC 指出 
档案 工作 者 在 背景 信息 管理 方面 具有 优势 ,从 初步 调 
查 到 资料 处 理 和 元 数据 的 创建 ,对 文件 生命 周期 每 个 
背景 理解 都 至 关 重要 ,这 在 研究 领域 同样 重 
5 可 。 在 科研 成 果 发 现 、 发 表 之 前 ,如 果 缺 失 了 档案 
; 钴 者 的 参与 ,可 能 导致 半 失 有 关 数 据 来 源 . 背 景 和 项 
= 自 [4] 
忆 数 字 环 境 下 ,相关 背景 信息 通常 通过 元 数据 来 体 
现 s 完 数据 是 数据 规范 化 管理 的 基础 ,也 是 数据 管理 计 
区 重要 组 成 部 分 。 在 数字 档案 资源 管理 中 ,只 要 始 
终 沦 握 其 形成 管理 与 利用 的 元 数据 ,并 与 档案 资源 内 
容 和 互 关联 ,就 可 以 掌握 其 生成 与 运转 的 来 龙 去 脉 ,从 
确诊 效 维护 档案 资源 的 历史 联系 5 。 元 数据 也 是 科 
学 帮 据 管理 的 基本 工具 。 然 而 ,科学 数据 生成 者 一 
科 咯 人 员 往 往 缺 乏 元 数据 “驱动 着 数据 管理 生命 周期 
中 韦 有 步骤 "的 认识 ,描述 背景 的 元 数据 供给 不 足 , 需 
要 数据 管 护 人 员 补充 改善 ”。 此 外 ,背景 元 数据 往往 
随 壮 数据 管理 过 程 不 断 产生 ,很 难事 后 补 录 。ICA 提 
出 在 项 目 规划 阶段 就 应 将 存档 元 数据 声明 等 设计 在 
内 ,在 数据 保存 和 管理 过 程 中 尽 可 能 捕获 工作 流程 数 
据 ,保障 科学 数据 及 其 背景 信息 的 及 时 和 完整 保存 , 避 
免 有 价值 的 背景 信息 的 缺失 。 
2.3 ”档案 鉴定 处 置 与 科学 数据 管理 工作 
2.3.1 档案 鉴定 处 置 

“鉴定 是 最 崇高 的 职能 ,是 当代 档案 实践 的 核 
心 "5 。 在 档案 学 领域 ,鉴定 又 称 价值 鉴定 ,是 指 判断 
原始 业务 信息 ( 即 文件 ) 在 业务 结束 后 是 否 仍然 具有 
保存 价值 的 工作 。 鉴 定 关系 到 档案 管理 对 象 的 选择 ， 
是 最 核心 和 关键 的 档案 管理 活动 ,包括 对 文件 信息 的 
价值 进行 评估 ,判断 其 在 业务 .制度 .法律 财政、 历史 
等 方面 的 价值 及 其 对 未 来 的 潜在 使 用 价值 ,从 而 判定 
其 是 否 属于 归档 范围 并 确定 保管 期 限 的 过 程 。 档 案 学 
在 长 期 发 展 过 程 中 ,形成 了 具有 很 强 理论 根基 的 价值 


鉴定 理论 ,先后 建立 了 高 龄 档案 鉴定 论 .职能 鉴定 法 、 
直接 鉴定 法 、 利 用 需求 预测 法 等 多 种 鉴定 方法 。 数 字 
时 代 职 能 鉴定 法 得 到 全 世界 档案 理论 研究 领域 和 实践 
领域 的 广泛 认同 ,并 在 中 、 美 , 澳 、 加 等 多 个 国家 的 档案 
鉴定 政策 中 得 以 体现 。 档 案 部 门 会 根据 鉴定 方法 的 应 
用 结果 ,精心 设计 保管 期 限 表 来 支持 档案 保管 期 限 的 
划分 以 及 档案 的 处 置 工作 ,包括 将 具有 长 期 保存 价值 
的 档案 移交 到 档案 馆 进 行 长 期 或 永久 保存 ,对 保管 到 
期 的 档案 进行 销毁 等 ”| 。 
2.3.2 ”对 科学 数据 管理 工作 的 支撑 

随 着 科学 数据 在 各 类 科研 活动 中 的 急剧 产生 , 海 
量 科 学 数据 存储 的 成 本 和 效益 问题 浮 出 水 面 :一 方面 ， 
随 着 数字 内 容 的 不 断 扩展 ,尽管 数据 存储 载体 的 成 本 
有 所 下 降 , 但 是 数据 备份 .元 数据 维护 .格式 管理 质量 
检测 等 数据 维护 的 成 本 成 倍 地 增加 。 只 有 当 科 学 数据 
自身 所 具有 的 价值 大 于 其 管理 成 本 时 , 才 有 必要 加 以 
续 存 ,然而 并 非 所 有 的 科学 数据 都 具备 这 样 的 潜在 价 
值 ; 另 一 方面 ,保存 所 有 数据 会 给 数据 检索 和 利用 带 来 
巨大 的 挑战 ,保存 的 内 容 越 多 ,检索 的 信 噪 比 越 高 , 数 
据 用 户 精 确 获取 目标 数据 的 效率 就 越 低 。 因 此 ,开展 
科学 数据 的 鉴定 非常 必要 ,笔者 所 调研 的 中 国 科 学 院 
高 能 物理 研究 所 的 数据 管理 人 员 就 提 到 ,在 数据 管理 
实践 中 ,虽然 大 量 科学 数据 都 可 能 具有 保存 价值 ,但 是 
出 于 经 费 原因 ,只 能 选择 其 中 具有 重要 价值 的 数据 进 
行 保存 , 且 保 存 的 时 间 长 短 也 将 取决 于 经 费 的 支持 情 
况 。DCC 也 指出 “科学 数据 存储 的 规模 非常 大 ,而 且 
需要 保存 足够 的 元 数据 以 确保 数据 随时 间 推 移 可 追 
淹 .可 理解 和 可 用 。 考 虑 到 长 期 保存 和 管理 数据 需要 
承担 的 未 来 费用 ,数据 创建 者 和 管理 者 都 无 法 逃避 做 
出 鉴定 决策 ”" 。 然 而 ,实践 中 最 重视 的 仍 是 近期 的 
科学 数据 汇 交 和 共享 利用 ,对 相对 长 远 的 鉴定 处 置 等 
问题 仍 缺乏 有 效 经 验 ,鉴定 的 责任 主体 亦 不 明确 ” 。 
档案 鉴定 处 置 方法 有 助 于 支持 科学 数据 管理 者 有 效 选 
择 数据 ,判定 其 保存 价值 和 保管 期 限 。 
国际 组 织 相关 成 果 对 档案 鉴定 处 置 方 法 在 科学 数 
据 的 挑选 和 成 本 效益 权衡 等 方面 的 价值 达成 了 共识 ， 
均 将 可 用 性 、 重 用 价值 数据 质量 等 作为 科学 数据 鉴定 
的 重要 参考 标准 ,并 对 数据 鉴定 主体 和 技术 操作 思路 
进行 了 探讨 ,形成 了 具有 参考 价值 的 成 果 , 代 表 性 观点 
包括 DCC 的 综合 价值 评估 法 和 五 步骤 实施 策略 ,ICA 
的 鉴定 三 标准 和 文件 数据 保管 处 置 方案 ,OCLC 的 分 阶 
段 鉴 定 思 路 等 。 

DCC 明确 将 “鉴定 和 挑选 "作为 管 护 生命 周期 的 
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八 项 活动 之 一 ,要 求 数 据 管理 者 “鉴定 并 挑选 数据 以 进 
行 长 期 管 护 和 保存 ”" ,建议 “研究 机 构 的 数据 馆 员 和 
档案 管理 员 主 要 负责 制定 挑选 和 鉴定 政策 ,参考 数据 
生成 者 .数据 重用 者 研究 社 区 等 利益 相关 方 的 意见 制 


证 结果 的 必要 性 ; 包 要 能 确保 数据 保存 后 访问 获取 的 
可 行 性 ;@ 数 据 要 有 重用 和 创建 新 研究 的 可 能 性 “” 。 
在 鉴定 的 基础 上 ,对 应 研究 活动 各 阶段 科学 数据 的 产 
生 情 况 ,ICA 为 除 研 究 问题 提出 之 外 的 每 个 阶段 都 制 


定 政策 。 其 中 ,研究 机 构 制 定 的 鉴定 政策 需要 规 
定 评估 数据 集 价值 的 七 个 标准 ,分 别 为 :与 科研 机 构 使 
命 的 相关 性 ,数据 的 科学 文化 或 历史 价值 ,数据 独特 
性 ,数据 质量 ,数据 的 不 可 复制 性 ,经 济 成 本 ,著录 的 完 
整 性 ,并 判断 数据 的 保管 期 限 和 销毁 时 间 "。 此 外 ， 
DCC 还 提出 通过 考虑 潜在 的 数据 重用 需求 .检查 各 类 
数据 指标 (确保 满足 法 律 和 政策 要 求 ) .确定 具有 长 期 
保存 价值 的 数据 .权衡 经 济 成 本 ,制定 保存 或 处 置 行动 
等 五 个 具体 步 又 开展 数据 的 鉴定 工作 5 。 

本 ICA 倡导 的 数据 鉴定 要 遵循 三 个 基本 标准 ,保证 
数据 的 可 信 度 ,有 效 性 和 质量 ;数据 要 具备 用 于 验 
CO 


定 了 一 份 文件 与 数据 保管 与 处 置 方案 (示例 见 表 3 ) ， 
详细 规定 了 要 收集 的 文件 和 数据 类 型 .载体 格式 、 保 管 
和 处 置 要 求 及 利用 限制 等 主要 内 容 ,提供 了 直接 可 参 
考 的 科学 数据 归档 范围 及 保管 期 限 规范 ” 。 

OCLC 提出 鉴定 可 以 分 一 个 或 多 个 阶段 进行 。 鉴 
于 电子 档案 鉴定 在 对 档案 内 容 有 用 性 的 价值 鉴定 之 
外 ,增加 了 对 其 是 否 处 于 可 用 状态 的 技术 鉴定 ,0OCLC 
建议 在 存储 机 构 与 移交 者 进行 交接 前 或 在 材料 被 收集 
保存 之 后 进行 价值 鉴定 ,在 收集 之 前 对 包含 原始 数字 
言 息 的 材料 进行 技术 鉴定 ,即使 用 适当 的 数字 工具 进 
行 检查 ,审查 内 容 是 否 损坏 和 算 改 等 '”。 


表 3 ”数据 收集 阶段 文件 与 数据 保管 与 处 置 方案 ”” 


文件 /数据 格式 行动 


备注 


全 
辐 。。 现 数据 
< 或 限制 访问 
OO sw 数字 ; 纸 质 。 同上 
攻关 实验 和 观测 的 雪 议 书 数字 ; 纸 质 。 同上 
人 实验 宝 笔 记 数字 ; 纸 质 ”同上 
CN 期 刊 数字 ; 纸 质 同上 
仿真 文件 ( 如 数据 模型 ) 数字 ; 纸 质 ”同上 
S| 
>< 序列 数据 数字 ; 纸 质 。 同上 


© 


2 生 数字 档案 长 期 保存 与 科学 数据 管理 工作 
2. 弛 | ”数字 档案 长 期 保存 

作为 信息 管理 领域 的 重要 任务 ,数字 信息 的 长 其 
保存 已 经 引起 了 图 书馆 学 .档案 学 和 数据 科学 等 多 学 
科 领 域 的 共同 关注 和 实践 中 多 部 门 的 共同 推进 。 其 
中 ,档案 部 门 基于 长 期 管 护 社会 记忆 资产 的 职责 所 在 ， 
致力 于 保障 文件 档案 信息 的 长 久 可 用 和 长 久 可 信 。 经 
过 多 年 探索 ,国际 档案 领域 在 数字 档案 信息 的 长 期 保 
存 实践 方面 已 经 积累 了 丰富 的 经 验 ,并 形成 了 一 些 独 
特 的 技术 路 线 , 如 英国 国家 档案 馆 开发 的 数字 格式 合 
记 系 统 PRONOM 项 目下 ,瑞士 联邦 档案 馆 开 发 的 基于 
XML 进行 长 期 保存 关系 数据 库 的 SIARD 方案 、 澳 
大 利 亚 维多利亚 州 采用 的 元 数据 封装 方案 ( VEO)™ 
等 , 均 产生 了 广泛 的 国际 影响 力 。 国 际 上 已 经 普遍 认 
同 将 数字 档案 馆 认 定 为 数字 存储 库 的 重要 类 型 ,为 数 
据 集 提供 存储 和 访问 平台 ,开展 标准 化 的 数据 质量 控 


数字 ; 纸 质 名 根据 保存 标准 长 期 保存 ;四 如 果 需 要 鉴定 ,处 置 
方式 必须 记录 在 案 ;@@ 根 据 约束 规则 进行 公共 获取 


中 只 要 用 于 验证 研究 结果 ,一 般 至 少 保存 10 年 ， 
有 关 毒 品 研 究 的 内 容 保存 15 年 ;@ 数 据 获 取 应 遵 
循 国家 规定 或 机 构 .学科 规则 

同上 

同上 

同上 

根据 国家 规定 实施 

了 只 要 用 于 验证 研究 结果 ,一般 至 少 保存 10 年 ;@ 
数据 获取 应 遵循 国家 规则 或 机 构 .学 科 规定 


制 和 完整 的 生命 周期 管理 。 
2.4.2 ”对 科学 数据 管理 工作 的 支撑 

科学 家 越 来 越 认 识 到 ,他 们 缺乏 满足 数据 保存 所 
需 的 技能 和 专业 知识 ,正在 寻求 “数据 档案 管理 员 ” 的 
帮助 ,因为 对 档案 资源 的 收集 、 组 织 和 长 期 保存 是 档案 
工作 者 的 专业 使 命 ”。 国 外 许多 科研 资助 机 构 和 科研 
管理 机 构 都 将 “数据 归档 和 长 期 保存 ” 列 为 数据 管理 
计划 的 重要 组 成 部 分 ,而 我 国 的 《办 法 》 仅 对 科学 数 
据 保存 提出 原则 性 要 求 ” 。 根 据 笔者 调研 ,实际 单位 
目前 对 长 期 保存 虽 有 思考 ,但 主要 采用 备份 等 基本 策 
略 ,缺乏 迁移 ,仿真 保存 元 数据 等 核心 策略 的 应 用 。 
2019 数字 资源 长 期 保存 全 国学 术 研讨 会 上 ,有 专家 指 
出 档案 工作 者 在 档案 管理 实践 中 就 长 期 保存 形成 的 方 
法 经 验 和 实践 成 果 可 以 为 科学 数据 的 长 期 保存 提供 一 
定 的 参考 。 

DCC 提供 了 数据 存储 的 可 选 方 案 指 南 , 指 出 有 上 
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百 种 可 以 进行 数据 存储 的 存储 库 , 各 有 不 同 的 优 缺 点 ， 
为 开放 获取 选择 存储 库 和 为 长 期 保存 选取 存储 库 所 考 
虑 的 因素 是 不 同 的 。 就 开放 获取 和 共 至 数据 而 言 , 学 
科 特 定 的 数据 存储 库 、 科 学 数据 中 心 、 通 用 数据 存储 
库 、 机 构 数据 存储 库 .期刊 补充 资料 服务 .网 站 等 可 以 
作为 存储 数据 的 选项 ;而 就 数据 的 长 期 保存 而 言 , 长 期 
保存 的 成 本 .安全 性 和 可 用 性 是 数据 保存 的 重点 因素 ， 
建议 通过 综合 考量 ,选择 机 构 数 据 档 案 库 、 安 全 中 心 、 
云 存储 、 数 据 存 档 第 三 方 服务 等 方案 进行 长 期 保 
在 ”。 

ICA 指南 从 档案 学 专业 角度 出 发 ,提出 了 科学 数 
据 和 文件 长 期 保存 与 管 护 方面 的 基本 标准 和 策略 , 强 
调 科学 数据 文件 档案 管理 要 和 科研 活动 的 流程 集成 ， 


ess 


防 此 造成 后 期 无 法 弥补 或 者 成 本 过 高 的 损失 和 风险 。 
此 拓 


,应 通过 迁移 .仿真 或 以 原生 格式 保存 等 不 同 策略 
长 期 保存 。RDA 的 APARD 小 组 也 十 分 关注 科 


学 肢 据 的 长 期 保存 问题 ,其 第 9 次 全 体会 议 的 主题 即 
“ 玄 焦 数字 保存 ”” ,第 11 次 全 体会 议 上 提出 起 草 有 
关 数 字 保 存 的 简要 指南 ,收集 ARPRD 成 员 和 其 他 小 组 
存 准 科学 数据 相 较 于 其 他 数字 资产 在 长 期 保存 中 所 面 
八国 特殊 挑战 的 观点 ,并 依据 美国 国家 数字 管理 联盟 
(Nilional Digital Stewardship Alliance, 简称 NDSA ) 的 
雏 这 保存 级 别 ”文档 (The NDSA Levels of Digital Pres- 
erzion: An Explanation and Uses) ,讨论 潜在 的 更 新 或 
修 汉 思路 。 

已 在 国外 科学 数据 管理 实践 中 ,已 经 有 研究 机 构 与 
档案 馆 合 作 或 建设 数字 档案 馆 开 展 数据 长 期 保存 的 案 
全 业 为 科学 数据 长 期 保存 提供 了 档案 机 构 参与 的 实 
践 经 验 。 如 伊利 诺 伊 大 学 香槟 分 校 图 书馆 研究 数据 服 
务 中 心 (Research Data Service , 简称 RDS ) 与 大 学 档案 
馆 合 作 ,承诺 在 RDS 出 版 数据 后 至 少 5 年 内 保存 并 促 
进 对 数据 集 的 访问 ,在 RDS 接收 研究 数据 五 年 之 后 ， 
基于 档案 学 的 鉴定 理论 ,再 决定 继续 保留 .增加 资源 抑 
或 销毁 。 美 国 国家 科学 基金 会 资助 的 大 气 研 究 中 
心 (National Center for Atmospheric Research, 简称 
NCAR ) 建立 了 研究 数据 档案 馆 , 用 于 支持 长 期 保存 具 
有 不 可 替代 性 的 科学 数据 ,以 及 超过 40 年 的 异 构 存 档 


理 面 临 的 档案 管理 视角 缺失 的 现实 问题 ,建议 通过 开 
展 跨 学 科 协作 对 话 ,建立 跨 机 构 连续 性 制度 框架 .培养 
具备 档案 专长 的 数据 馆 员 等 路 径 ,促进 运用 档案 学 知 
识 技 能 提升 科技 信息 资源 的 整体 管理 效能 。 

3.1 开展 科学 数据 管理 的 跨 学 科 协 作对 话 

国际 组 织 已 经 在 科学 数据 管理 的 跨 学 科 对 话 上 取 
得 了 相应 进展 ,如 OCLC 专门 设计 了 在 研究 图 书馆 系 
统 内 面向 档案 馆 和 特 藏 部 门 的 研究 学 习 议 程 ( Re- 


search and Learning Agenda for Archives, Special, and 


Distinctive Collections in Research Libraries ) ,成 立 了 由 
档案 馆 和 特 藏 部 门 负责 人 组 成 的 咨询 组 ,了 解 在 整个 
科研 管理 生态 系统 内 跨 部 门 、 跨 专业 领域 的 不 同 管理 
问题 和 知识 需求 ,促进 宣传 和 开发 档案 馆 和 特 藏 部 的 
资源 ,由 咨询 组 的 专家 成 员 在 整个 研究 过 程 中 定期 提 
供 咨 询 和 意见 ” 。RDA 也 提出 档案 工作 者 ,文件 管理 
专业 人 员 和 图 书馆 员 长 期 以 来 一 直 共 同 致 力 于 获取 、 
鉴定 、 编 目 .管理 .保存 和 提供 获取 数字 和 模拟 的 研究 
材料 ,这 些 专业 人 员 都 拥有 可 以 为 最 佳 实践 的 发 展 做 
出 巨大 贡献 的 技能 和 专业 知识 ,联手 协作 将 更 有 助 于 
良好 的 科学 数据 管理 和 共享 目标 的 实现 。 在 RDA 
联盟 实践 中 ,ARPRD 就 与 图 书馆 员 兴 趣 组 (Libraries 
for Research Data 1G ) 合作 ,在 第 11 次 论坛 上 举行 的 
联合 会 议 上 ,共同 探讨 两 个 小 组 可 以 合作 的 项 目 及 
主题 ,包括 研究 数据 的 鉴定 数字 保存 、 元 数据 等 , 希 
望 通过 小 组 合作 的 方式 推动 对 研究 数据 管理 相关 领 
域 的 发 展 。 两 个 专业 组 还 致力 于 合作 开发 科学 数据 
管理 基础 设施 和 最 佳 实践 ,以 确保 在 五 年 二 十 年 、 
五 十 年 .一 百年 或 更 长 时 间 内 可 以 访问 和 使 用 数据 
集 ™|。 

虽然 我 国 从 20 世纪 80 年 代 起 就 倡导 图 书 、 情 报 
和 档案 的 一 体 化 管理 和 发 展 ,但 是 在 学 科研 究 和 发 展 
实践 中 ,壁垒 仍然 明显 存在 。 除 了 缺乏 跨 领 域 的 机 构 
合作 之 外 ,我 国 当 前 尚未 建立 融合 图 书馆 学 .情报 学 、 
档案 学 数据 科学 等 信息 学 科 的 综合 研究 协会 组 织 ， 
来 可 以 考虑 加 强 该 综合 学 科 领 域 的 合作 建设 。 同 时 以 
司 际 组 织 的 合作 研究 和 兴趣 小 组 机 制 为 启发 ,建议 我 
司 的 图 书馆 学 会 .档案 学 会 和 科学 技术 情报 协会 等 充 


数据 ,通过 持续 更 新 技术 以 增强 数据 发 现 和 访问 能 
力 ,为 NCAR 研究 人 员 提 供 数据 管理 支持 5 。 


3 ”研究 讨论 


基于 国际 组 织 和 学 界 运用 档案 学 理论 与 方法 参与 


分 利用 现 有 的 合作 平台 ,或 在 国际 科技 数据 委员 会 中 
司 委员 会 中 设立 相关 研究 兴趣 小 组 ,就 多 学 科 共 同 关 
注 的 数据 长 期 保存 .数据 鉴定 、 元 数据 数据 存储 库 等 
问题 加 强 探 索 创 新 ,增进 对 其 他 学 科 特 长 的 了 解 ,合作 
促进 开发 和 完善 相关 科学 数据 管理 基础 设施 ,以 服务 


科学 数据 管理 工作 的 研究 ,结合 我 国 当 前 科学 数据 管 


于 科学 数据 的 全 生命 周期 管理 。 
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3.2 建立 跨 机 构 的 科学 数据 连续 性 管理 制度 框架 
在 档案 学 领域 ,连续 性 管理 思维 除了 强调 信息 对 
象 的 全 流程 连续 之 外 ,还 强调 文件 档案 管理 从 文件 形 
成 单位 到 档案 馆 的 管理 连续 性 ,形成 一 个 完整 的 跨 机 
构 制 度 框架 ,也 可 以 为 科学 数据 的 管理 提供 全 流程 连 
续 性 管理 视角 ,促进 科学 数据 管理 的 多 主体 合作 ,加 强 
管理 的 连贯 性 。 
从 资源 视角 来 看 ,需要 促进 科学 数据 和 科研 档案 
的 集成 管理 和 服务 。 科 学 数据 和 科研 档案 在 对 象 上 存 
在 交叉 ,但 我 国 的 科学 数据 和 科研 档案 的 管理 长 期 处 
于 "割裂 "状态 , 既 没有 将 档案 管理 环节 纳 人 科学 数据 
的 管理 过 程 ,也 没有 将 科研 档案 的 共享 利用 纳入 科学 
数据 共享 利用 中 。 科 研 院 所 的 科学 数据 管理 和 档案 管 


理 一 般 由 不 同 职能 管理 部 门 承担 ,二 者 存在 着 显著 的 
分 王 差 异 和 不 同 的 业务 侧重 ,尚未 形成 从 科学 数据 生 
成 到 归档 保存 的 完整 链条 。 随 着 近年 来 国际 科学 界 晶 
补 量 视 科 研 成 果 \ 科 学 过 程 数据 和 科研 管理 档案 的 集 
成 医 享 利用 ,客观 上 也 对 存储 在 档案 馆 的 科研 档案 和 
存储 在 科学 数据 中 心 的 科学 数据 提出 了 整合 服务 的 需 


CQ 度 ,档案 部 门 与 科学 数据 中 心 就 数据 汇 
六 区 式 .数据 提交 规范 数据 管理 方案 和 长 期 保存 计划 
鱼 齐 行 协 商 及 研究 5 ,推动 两 项 工作 的 融合 发 展 ; 同 
时 示 断 推进 科研 档案 的 数据 化 和 资源 整合 服务 ,打破 
“信息 孤岛 ” ,增强 科技 信息 资源 管理 和 服务 的 整体 水 
平 e> 目 前 我 国 仅 有 全 国 地 质 资料 馆 等 少量 具有 科技 信 
息 资源 一 体 化 管理 职能 的 机 构 , 在 开展 科学 数据 管理 
的 同时 承担 着 档案 馆 的 功能 ,应 大 力 支持 和 推广 此 类 
机 构 的 协同 发 展 模式 ,促进 科学 数据 和 科研 档案 的 协 
同 管理 。 

从 管理 视角 来 看 ,科学 数据 的 管理 并 非 仅仅 是 科 
研 机 构 的 任务 ,其 生成 到 保存 可 能 需要 跨 机 构 开 展 , 同 
样 需要 构建 跨 机 构 的 管理 框架 。 国 外 科学 数据 管理 领 
域 已 经 将 档案 馆 视 为 一 种 重要 的 数据 存储 库 类 型 。 随 
着 我 国 数字 档案 馆 的 不 断 建设 ,档案 机 构 也 具备 了 一 
定 的 长 期 保存 数字 信息 资源 的 能 力 ,建立 了 较为 成 熟 
的 长 期 保存 技术 策略 ,可 以 作为 科学 数据 存储 库 的 分 
担 者 ,与 科学 数据 中 心 等 共同 承担 科学 数据 的 保存 , 管 
理工 作 , 尤 其 是 具有 重要 的 社会 .历史 .文化 价值 的 科 
学 数据 ,可 以 选择 移交 到 档案 馆 进行 保存 。 在 此 基础 
上 ,档案 工作 者 将 有 机 会 成 为 存储 库 管理 者 ,数据 馆 员 
或 数据 科学 家 ,从 而 发 挥 自身 的 技能 和 专长 参与 到 科 
学 数据 管理 工作 中 下!。 


3.3 ”培养 具备 档案 专长 的 数据 馆 员 

随 着 e-science 和 open science 的 快速 发 展 和 科学 
数据 管理 需求 的 增加 ,国内 外 科研 机 构 、 科 研 资助 机 
构 .学术 图 书馆 与 信息 中 心 等 科学 数据 管理 机 构 出 现 
了 一 个 新 的 岗位 类 型 , 即 实施 科学 数据 管理 .开展 数据 
监管 ,服务 数据 开放 利用 的 数据 馆 员 。 虽 然 作为 一 个 
新 兴 的 职业 类 型 ,学 界 尚未 给 出 一 致 的 定义 ,但 是 在 科 
学 数据 管理 实践 领域 已 经 呈现 出 高 需求 ,国际 社会 科 
学 信息 服务 与 技术 协会 2017 年 收录 的 64 条 招聘 信息 
中 ,就 有 41 个 岗位 与 数据 馆 员 相 关 “ 。 顾 立 平等 提 
出 ,“ 开 放 科学 环境 下 的 数据 馆 员 , 应 是 运用 图 书馆 工 
作 原 理 、 具 备 科 学 数据 管理 知识 技能 ,了 解 开 放 科 学 运 
行 机 制 和 特定 研究 领域 知识 背景 的 数据 管理 从 业 人 
员 ”' 中 。 这 一 定义 首先 强调 了 科学 数据 管理 中 图 书馆 
工作 原理 的 重要 性 ,但 没有 明确 档案 学 理论 与 方法 的 
必要 性 。 笔 者 认为 ,档案 学 知识 技能 应 自动 包含 在 “ 科 
学 数据 管理 知识 技能 "之 内 , 即 充分 理解 数字 文档 连续 
性 管理 思维 、 了 解 背景 信息 管理 需求 熟悉 数据 鉴定 原 
则 和 掌握 数据 长 期 保存 技能 。 

因此 ,有 必要 加 强 培养 具备 档案 专长 的 数据 馆 员 。 
首先 ,可 以 针对 科研 机 构 、 科 研 资助 机 构 、 学 术 图 书馆 
和 信息 中 心 等 既 有 的 数据 馆 员 ,组织 开展 档案 学 相关 
知识 技能 的 培训 和 指导 ,打开 其 运用 档案 思维 开展 科 
学 数据 管理 的 视野 。 如 美国 国家 档案 馆 和 文件 管理 署 
开设 了 数据 管 护 与 培训 项 目 , 以 及 英国 数据 档案 馆 专 
门 为 社会 科学 领域 的 学 者 提供 培训 服务 等 均 是 档案 界 
近年 来 积极 开展 数据 管理 较为 成 功 的 案例 。 此 外 ， 
可 以 在 高 等 院 校 .研究 院 所 开设 的 图 书馆 学 档案 学 、 
数据 科学 .信息 资源 管理 等 学 科学 位 教育 中 ,为 有 志 于 
从 事 科 学 数据 管理 工作 的 学 生 提 供 数 据 管 护 及 档案 学 
相关 的 必修 、 选 修 课 程 ,完善 其 知识 结构 ,培育 数据 管 
理 综合 素养 。 如 加 州 大 学 洛杉矶 分 校 .印第安 纳 大 学 、 
西蒙 斯 学 院 \ 马 里 兰 大 学 密 葡 根 大 学 等 多 所 国际 著名 
高 校 的 信息 学 院 在 图 书 情报 学 或 档案 学 硕士 培养 方案 
中 设立 了 数字 文件 与 信息 管理 .数字 保存 .数据 管 护 、 
元 数据 .可 信 数 字 仓 储 等 相关 课程 ,注重 全 面 培 养 学 生 
的 数字 信息 管 护 技能 。 最 后 ,相关 机 构 聘 用 数据 馆 员 
时 ,应 将 具备 档案 学 专业 教育 背景 的 毕业 生 或 具有 档 
案 从 业经 验 的 人 员 纳 入 招聘 范围 ,以 丰富 科学 数据 管 
理 的 人 才 结构 。 只 有 将 档案 学 知识 技能 纳入 到 数据 馆 
员 培 养 和 聘用 的 需求 框架 之 内 ,才能 真正 发 挥 档案 专 
长 ,更 好 地 服务 和 完善 科学 数据 管理 工作 。 
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档案 学 理论 与 方法 在 科学 数据 管理 领域 具有 独特 
的 专业 价值 , 且 日 益 受 到 科学 数据 管理 研究 领域 的 重 
视 。 鉴 于 国内 档案 机 构 和 档案 从 业 人 员 在 科学 数据 管 
理 中 参与 度 较 低 、 科 学 数据 管理 中 档案 视角 相对 缺失 
的 现象 ,有 必要 借鉴 国际 组 织 的 相关 研究 成 果 ,推动 加 
强 科 学 数据 管理 的 跨 学 科 . 跨 领 域 . 跨 机 构 的 协作 交 
流 ,充分 挖掘 档案 学 的 优势 ,培养 具备 档案 专长 的 数据 
馆 员 ,使 其 参与 到 制定 科学 数据 鉴定 方案 .长 期 保存 规 
范 、 元 数据 方案 和 连续 性 管理 制度 的 实践 中 ,进而 推动 
科学 数据 管理 和 共享 服务 的 提 质 增 效 。 
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>< Absiract: | Purpose/significance | In the context of global e-science development, scientific data management 
Qctices have increasingly shown a desire for interdisciplinary thinking and methods. The use of relevant theories and 
thods in the field of archives can help improve the quality and efficiency of scientific data preservation, sharing, 
rd reuse. | Method/ process | By use of text coding analysis and comprehensive integration method, the archival 
methods and the involved scientific data management work were extracted and inducted from the research achieve- 
ments of four international organizations including OCLC, DCC, RDA and ICA, as well as other related literature. 
| Result/ conclusion | It is found that the methods of archival science include appraising and disposal, digital conti- 
nuity, context management, long-term preservation are necessary to carry out scientific data management. It is recom- 
mended to improve the effectiveness of scientific data management by conducting interdisciplinary cooperation dia- 
logues, establishing a cross-agency continuity management regulation framework, and cultivating data librarians with 
archival expertise. 
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